Evaluación del modelado acústico y prosódico del sistema de conversión texto-voz Cotovía

نویسندگان

  • Francisco Campillo Díaz
  • Eduardo Rodríguez Banga
چکیده

Unit selection speech synthesis has become the most researched area in speech technology, as a result of its high-quality performance. There are many approaches about the key points in this technology, that is, the cost functions design, speech parameterisation and prosody estimation, but there is very little research about suitable methods for evaluating the improvements in synthetic speech. In this work the subjective and objective tests performed on our TTS system Cotov́ıa are presented.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Integración de optimización evolutiva para el reconocimiento de emociones en voz

Resumen. En este art́ıculo se presenta el desarrollo de un sistema de reconocimiento de emociones basado en la voz. Se consideraron las siguientes emociones básicas: Enojo, Felicidad, Neutro y Tristeza. Para este propósito una base de datos de voz emocional fue creada con ocho usuarios Mexicanos con 640 frases (8 usuarios × 4 emociones × 20 frases por emoción). Los Modelos Ocultos de Markov (Hid...

متن کامل

Sistema de Conversión Texto a Voz de Código Abierto Para Lenguas Ibéricas

This paper presents a text-to-speech system based on statistical synthesis which, for the first time, allows generating speech in any of the four official languages of Spain as well as English. Using the AhoTTS system already developed for Spanish and Basque as a starting point, we have added support for Catalan, Galician and English using the code of available open-source modules. The resultin...

متن کامل

PHILIPS: Intelligent Speech Interpretation - la tecnología inteligente de reconocimiento de voz

Resumen: Independientemente de la aplicación, el núcleo de cualquier sistema de reconocimiento de voz sigue siendo la inteligencia que convierte el habla en texto. Al reconocer lo que se dice e interpretarlo de forma razonable, garantiza una intervención mínima en el proceso de trascripción para producir informes útiles. Palabras clave: Philips, SpeechMagic, reconocimiento del habla, tecnología...

متن کامل

Avivavoz: Tecnologías Para La Traducción De Voz

AVIVAVOZ es un proyecto de tres años dirigido a la investigación avanzada en todas las tecnologías clave que intervienen en un sistema de traducción de voz (reconocimiento, traducción y síntesis de voz). El objetivo del proyecto es lograr avances reales en todos los componentes de un sistema de traducción de voz para alcanzar sistemas de intermediación oral entre personas en las lenguas oficial...

متن کامل

Modelo de duración para conversión de texto a voz en euskera

This paper presents the modelling of phone durations in standard Basque, to be included in a text-to-speech system. The statistical modelling has been done using binary regression trees and a large corpus containing 57.300 phones. Several experiments have been performed, testing different sets of predicting factors. The result when predicting durations with this model has a RMSE of 22.23 ms.

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:
  • Procesamiento del Lenguaje Natural

دوره 35  شماره 

صفحات  -

تاریخ انتشار 2005